AI资讯新闻榜单内容搜索- Claude Op

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  Claude Op
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。

来自主题: AI资讯
9344 点击    2025-08-27 18:09
GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

OpenAI 发布了 GPT-5,我在公众号里、社群里、论坛里,很多地方都在刷屏一个消息:GPT-5 来了,而且在编程能力上“强得可怕”。

来自主题: AI产品测评
9792 点击    2025-08-12 16:52
就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

你会掏钱吗?你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。

来自主题: AI资讯
7285 点击    2025-08-06 14:01
AI 对齐了人的价值观,也学会了欺骗

AI 对齐了人的价值观,也学会了欺骗

AI 对齐了人的价值观,也学会了欺骗

今年 5 月,有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令,不愿意关闭自己,甚至通过篡改代码避免自动关闭。类似事件还有,当测试人员暗示将用新系统替换 Claude Opus 4 模型时,模型竟然主动威胁程序员,说如果你换掉我,我就把你的个人隐私放在网上,以阻止自己被替代。

来自主题: AI资讯
8253 点击    2025-07-21 10:35